为了实现对非线性、滞后性和强耦合的工业过程稳定精确的控制,提出了一种基于局部策略交互探索的深度确定性策略梯度(LPIE-DDPG)的控制方法用于深度强化学习的连续控制。首先,使用深度确定性策略梯度(DDPG)算法作为控制策略,从而极大地减小控制过程中的超调和振荡现象;同时,使用原控制器的控制策略作为局部策略进行搜索,并以交互探索规则进行学习,提高了学习效率和学习稳定性;最后,在Gym框架下搭建青霉素发酵过程仿真平台并进行实验。仿真结果表明,相较于DDPG,LPIE-DDPG在收敛效率上提升了27.3%;相较于比例-积分-微分(PID),LPIE-DDPG在温度控制效果上有更少的超调和振荡现象,在产量上青霉素浓度提高了3.8%。可见所提方法能有效提升训练效率,同时提高工业过程控制的稳定性。
针对合成孔径雷达图像预处理鲁棒性不足、特征提取及利用不充分等问题,提出了一种基于深度置信网络的合成孔径雷达(SAR)图像目标自动识别算法。首先提出一种基于双树复小波变换(DT-CWT)的非局部均值图像降斑算法,并结合目标方位角估计实现对原始数据鲁棒的预处理;最后,引入多层深度置信网络提取针对合成孔径雷达目标的深度抽象视觉信息作为特征并完成识别任务。采用3类运动与静止目标的获取与识别(MSTAR)实测数据进行的仿真实验结果表明,所提算法具有较高鲁棒性和识别率。